Metric Match: Selección de subconjuntos para evaluar la fiabilidad de LLM Metric Match reduce un 32% las anotaciones humanas para evaluar fiabilidad de jueces LLM, mejorando precisión y ahorrando costos. 2026-06-16 · 2 min